|
تاریخ انتشار:۱۴:۸ ۱۳۹۹/۴/۳
گراف دیتابیس چیست ؟ [قسمت اول]
پایگاه دادههای گرف یک راه حل بسیار قدرتمند برای ذخیره سازی و جستجوی دادههایی هستند که در آنها ارتباطات اهمیت بیشتری نسبت به دادهها اصلی دارند (مانند فیس بوک و توییتر) . با رشد روز افزودن دادهها و تنوع انوع دادهها، نیاز به ایجاد بسترهای جدید ذخیره سازی و آنالیز آنها بیشتر احساس شد، بسترهایی که دادههای نامنظم را با از دست ندادن انعطاف پذیری، حفظ سطح بالای عملکرد و اطمینان از مقیاس پذیری دادهها به طور مؤثر، نگهداری کنند، این مشکلی است که بانکهای اطلاعاتی رابطهای نمیتوانند از عهده آن برآیند.ما در زنجیره مقالههایی که در آینده منتشر خواهد شد، محبوب ترین پایگاه دادههای گراف را تجزیه و تحلیل میکنیم. این پایگاه دادهها عبارتند ازArangoDB ، Neo4Jو OrientDB ما مهمترین ویژگیها را برای گراف دیتابیسها بررسی خواهیم کرد و نهایتا به شما خواهیم گفت که برای انتخاب یک گراف دیتا بیس مناسب چه پارامترهایی را در نظر بگیرید
مقدمه
امروزه، حجم دادهها به صورت تصاعدی در شبکههای اجتماعی مانند فیس بوک و توییتر و در سطح اینترنت در حال رشد هستند که روزانه مقادیر انبوهی از دادهها را ذخیره و پردازش میکنند، جایی که این دادهها در حجم پتا بایت ذخیره میشوند. بانکهای اطلاعاتی رابطه ای و معمولی که در بازار هستند در پردازش و سازگاری با این حجم عظیم از داده ها ضعیف هستند و ضعیف عمل کردهاند. به همین دلیل، نوع خاصی از بانکهای اطلاعاتی به وجود آمد که آنها را بانک اطلاعاتی گراف مینامیم. گراف دیتابیسها را میتوان یکی از گروههای پایگاه داده غیر رابطهای دانست که یک راه حل موثر و کارآمد را برای ذخیره اطلاعات در سناریوهای فعلی، جایی که دادهها به طور فزایندهای به هم پیوسته و وابسته هستند، ارائه میدهد.
مکانیسمهای ذخیره سازی در پایگاه دادههای گراف برای ذخیره سازی به شکل نمودار بهینه شدهاند، یعنی ذخیره کردن سوابق و روابط مرتبط و نزدیک به هم. اصطلاحا یک لیست مجاورت برای هر یک از راسها و گروهها تشکیل میشود که این لیست شامل اشاره گرها و ارتباطات آن نود به نودهای همسایه هست، از این خاصیت و این شیوه ذخیره سازی به عنوان مجاورت عاری از شاخص نام برده میشود (رابینسون و همکاران، 2015). علاقه به مدلهای گراف به دلیل کاربردهای آنها در مباحثی مانند وب کاوی و تحلیل شبکههای اجتماعی در سالهای اخیر رو به افزایش بوده است (دیتریش و همکاران، 2008). این نوع بانک اطلاعاتی به راحتی قابل درک هستند زیرا مفهوم آنها براساس تئوری نمودارها و گراف ها است. این مدل دیتابیس ها و این تئوری اساساً براساس گرافهایی بنا شده است، که از ساختارهای ریاضی برای مدل سازی روابط بین اشیاء استفاده میکنند. ما در مقالههای آتی بیشتر راجع به مفاهیم اساسی گراف صحبت خواهیم کرد اما این را بدانید که یک گراف در اصل یک ساختار است که به وسیله نودها نمایش داده میشود، همچنین ما آنها را Vertex و یا موجودیت نیز میتوانیم نامگذاری کنیم. نودها به وسیله خطوطی که ما آنها را اصطلاحا یال و یا ارتباط مینامیم به هم وصل شدند که میتوانند یک سری خصوصیت را در قالب Propertyهای مختلف در خود نگه داری کنند. بنابراین گراف دیتابیسها میتوانند خیلی به راحتی ذخیره سازی و نمایش دادهها را توسط این سه ساختار نمایش دهند: Vertex (نود) ،Edge (یال) و Property (خصوصیت).
به همین دلیل گراف دیتابیسها راه حل بهینه ای برای ذخیره سازی و پرس و جوهای مبتنی بر گراف هستند.
مشکلی که در بانکهای اطلاعاتی گراف وجود دارد این است که آنها در نمایش برخی از دادههایی که از مدلهای رابطهای حاصل میشوند، کارآیی چندانی ندارند. بنابراین، آنها نمیتوانند جایگزین پایگاه دادههای رابطهای شوند، اما در واقع یک راه حل کارآمد هنگام برخورد با حجم عظیمی از دادهها هستند که حاوی بسیاری از دادههای مرتبط هستند.
مزایا و کاربردهای پایگاه داده گراف
با افزایش دادهها و افزایش مقیاس دادهها استفاده از پایگاه دادههای گراف محبوبیت بیشتری پیدا کرده است، سیستمهای مدیریت پایگاه دادهی رابطهای (RDBMS) از لحاظ مدیریت روابط بین نقاط دادهای ضعیف هستند. مدلهای داده مبتنی بر جدول و اسکیماهای سفت و سخت آنها و همچنین پر هزینه بودن عملیات Join کار را برای اضافه کردن و نگهداری انواع مختلف داده و نگه داری ارتباطات بین آنها دشوار میکند. گرافها آینده هستند. بانکهای اطلاعاتی گراف نه تنها به طور مؤثر روابط بین دادهها و موجودیتهای دادهای را ذخیره میکنند، بلکه در اضافه کردن انواع جدیدی از روابط یا تطبیق یک مدل داده با نیازهای تجاری جدید نیز انعطاف پذیر هستند (وببر و همکاران ، 2015). تغییرات شمای مکرر، مدیریت حجم عظیم دادهها، زمان پاسخ پرس و جوی مناسب و الزام در نگه داری روابط پیچیده بین دادهها باعث شد افراد از مزایای مدل گراف مطلع شوند و تصمیم به استفاده از آنها بگیرند. به کمک این فناوری تجزیه و تحلیل دادههای پیشرفته در بسیاری از زمینهها مانند تحلیل شبکههای اجتماعی، مدیریت زنجیره تأمین، سیستمهای پیشنهاد دهنده تجارت الکترونیکی، امنیت، کشف تقلب، علوم پزشکی، صنایع هوایی و بسیاری زمینههای دیگر دگرگون شد.
مهمترین مزیت بانکهای اطلاعاتی گراف موارد زیر هستند:
- بهینه سازی بهتر در جمع آوری اطلاعات نسبت به پایگاه دادههای رابطهای
- پشتیبانی از قوانین ACID
- پشتیبانی از ذخیره سازی دادهها با مرتبه زمانی مناسب
- استفاده از انواع جدید دادهها
- گسترش مدل گرافیکی با توجه به مدل ساختاری و برعکس
- مناسب برای دادههای پیچیده و نامنظم، که معمولاً در دنیای واقعی با آنها درگیر هستیم.
- مناسب برای عملیات داده کاوی؛
- عملکرد بهتر هنگام استفاده در پرس و جوهایی که عمق دادهها را رصد میکنند در مقایسه با پایگاه دادههای رابطهای.
- در برخی از گراف دیتابیسها برخلاف مدل رابطهای، نیازی به اعلام نوع داده برای گرهها یا یالها نیست.
- توسعه چابک (در طول زمان به راحتی با تغییرات سازگار میشوند)
- مدیریت BIG DATA، از جمله سری زمانی، ابعاد جغرافیایی و سلسله مراتبی در ابعاد مختلف.
به طور خلاصه، سه مزیت اساسی گراف دیتابیسها عبارتند از: عملکرد و کارایی، انعطاف پذیری و چابکی.
عملکرد و کارایی
در پایگاه دادههای سنتی ، با افزایش تعداد و عمق روابط، پرس و جوها به سمت پیچیدگی و بلاک شدن پیش میروند، در مقابل، عملکرد بانک اطلاعاتی گراف حتی با افزایش دادههای ما در طول سالها ثابت میماند.
انعطاف پذیری
تیمهای مدیریت داده به جای اینکه به طور جامع و گسترده از یک دامنه قبل از زمان الگوبرداری کنند و مجبور باشند به اسکیمای پایگاه داده قبل از شروع هر چیزی فکر کنند، میتوانند به ساختار گرافِ موجود بخشهایی رو اضافه کنند بدون اینکه عملکرد فعلی سیستم را به خطر بیاندازند.
چابکی چابکی به توسعه دهندگان پایگاه دادههای گراف این امکان را میدهد که کاملاً مطابق بر شیوههای توسعه سریع و تست محور امروزی منطبق باشند و به کارشناسهای بانک اطلاعات اجازه میدهد تا گراف را بطور قدم به قدم همراه با بقیه برنامه پیش ببرند و همراه با هرگونه تغییر شرایط مورد نیاز در کسب و کار تکمیل و تکمیلتر شوند.
منبع:nikamooz
|
|
|